EdgeRazor: Un marco ligero para modelos de lenguaje grandes mediante destilación consciente de cuantización de precisión mixta
EdgeRazor es un marco ligero para LLMs que emplea destilación y cuantización mixta, optimizando modelos de lenguaje para despliegue eficiente en dispositivos con recursos limitados.